#percepción multimodal

DSAEval: Evaluación de agentes de ciencia de datos en problemas reales

Descubre DSAEval, benchmark con 641 problemas reales que evalúa agentes de IA. Resultados: Claude-Sonnet-4.5 lidera en rendimiento.

2026-06-12 · 3 min

¿Juega la información visual un papel decisivo en la conducción de modelos VLA?

Analizamos la relación entre información visual y comportamiento de conducción en modelos VLA mediante perturbaciones controladas. Implicaciones para sistemas más seguros.

2026-06-01 · 2 min